# -- coding: utf-8 --
# -- coding: utf-8 --
import os
import pprint
import re

file_path = r'D:\sp\2\company_info_extrator\regular_matching_rules'


# 遍历文件夹及其子文件夹中的文件，并存储在一个列表中
# 输入文件夹路径、空文件列表[]
# 返回 文件列表Filelist,包含文件名（完整路径）


def get_filelist(dir, Filelist):
    newDir = dir
    if os.path.isfile(dir):
        Filelist.append(dir)

        # 若只是要返回文件文，使用这个
        # Filelist.append(os.path.basename(dir))

    elif os.path.isdir(dir):
        for s in os.listdir(dir):
            # 如果需要忽略某些文件夹，使用以下代码
            if s == "__init__.py":
                continue
            if s == "__pycache__":
                continue
            if s == "no_need_check":
                continue
            if s == "check_words.py":
                continue
            newDir = os.path.join(dir, s)
            get_filelist(newDir, Filelist)

    return Filelist


if __name__ == '__main__':
    list = get_filelist(r'D:\sp\2\company_info_extrator\regular_matching_rules', [])
    for e in list:
        # print(e)
        f = open(e, "r", encoding='UTF-8')
        g = f.readlines()
        i = ','.join(g)
        t = "附件"
        if t in i:
            pprint.pp(e)

